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Предлагается альтернативный стандартному формализму подход к обработке рекурсивных данных. Основной идеей является пер- 
вичность функциональности, а не данных. Функциональность реализуется механизмами, основанными на теории конечных авто- 
матов. Полученные результаты позволяют использовать новые методы для создания естественного описания предметной области, 
содержащей рекурсивные структуры, что, в свою очередь, повышает эффективность манипулирования такими данными. 


Классическая парадигма работы с организован- 
ными данными определяется реляционной мо- 
делью Кодда [1]. При всей своей строгости и лако- 
ничности эта модель обладает одним серьезным не- 
достатком - она является существенно эксплицит- 
ной, т. е. не допускает «динамики» в процессе ис- 
пользования. Существует много рекурсивных моде- 
лей, в которых образующим элементом является 
определенная внутренняя структура, сама являю- 
щаяся объектом модели, например, модели гено- 
мов, сложные химические образования или эконо- 
мические модели. В таких случаях, реляционный 
подход позволяет определять рекурсию на данных 
путем введения, например, явного понятия предка, 
однако, этот паллиативный вариант не более чем 
моделирует частичный порядок внесистемными 
конструкциями [2]. Определенное продвижение в 
организации рекурсивных данных может предоста- 
вить функциональный подход на основе А-форма- 
лизма Черча [3], реализованного, в частности, в се- 
мействе функциональных языков программирова- 
ния класса ЛИСП, естественно включающих ре- 
курсию, как базовую конструкцию управления. 

В рамках предлагаемого подхода основная роль 
отводится функциональной стороне. Считается, 
что любые данные появляются в результате интер- 


претации первичной составляющей модели, либо 
применения некоторого автомата к другим дан- 
ным. Таким образом, необходимо переопределить 
понятие запроса. Атомарный запрос есть первичное 
значение, допустимое в заданной интерпретации. 
Непервичный (автоматный) запрос определяется 
некоторым конечным автоматом и реализуется 
применением этого автомата к входным данным. 

Входной поток для фиксированного запроса 
(автомата) представляет собой список, сформиро- 
ванный другими атомарными либо автоматными 
запросами. Термины запрос и автомат считаются 
синонимами, если не оговорено противного. 

Различаются явное описание запроса и его реа- 
лизация. Согласно классическому определению, 
конечный автомат - это система с ограниченным 
набором состояний и определенной дисциплиной 
переходов [4], поэтому любая система, обладающая 
ограниченным набором возможностей, каждая из 
которых может быть отмечена отдельным состоя- 
нием, может быть представлена в виде конечного 
автомата (КА). 

Для строгого введения последующих понятий 
зафиксируем сигнатуру: 

Х = (А,Е,Т). (1) 
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Здесь А - множество символов атрибутов, Е - 
множество символов состояний, Т - множество 
символов доменов (возможных типов). Считается, 
что в Т зафиксировано непустое подмножество 
Ек^Т символов первичных доменов (й/0), содер- 
жащих базовые значения атрибутов (например, іп- 
Іе§ег, сіаТе, Іехі и т. д.). Считается, что при любой 
интерпретации первичному домену сопоставляется 
перечислимое множество элементов. 

С учетом заданной сигнатуры (1) непервичный 
автомат 0 определяется следующим образом: 

^^±(А,К,\,о,Р), ( 2 ) 

где 06 7\В и 0 не является именем первичного до- 
мена; А - алфавит над декартовым произведением 
Ах Т, то есть это все комбинации допустимых пар 
из декартова произведения типов и имен атрибу- 
тов; КеЕ - конечное множество состояний авто- 
мата; А - функция перехода, определенная на мно- 
жестве АхК ; <те К - начальное состояние; Е^К - 
непустое множество конечных состояний. 

В каждый фиксированный момент времени 
(такт) конечный автомат находится только в одном 
из возможных состояний, при этом число состоя- 
ний, в которых может находиться конечный авто- 
мат - конечно. Автомат последовательно считыва- 
ет элементы из входной строки. Каждый считан- 
ный символ либо переводит автомат в новое со- 
стояние, либо оставляет его в прежнем, одновре- 
менно КА генерирует элемент в выходную строку. 

Функция перехода, ассоциированная с автома- 
том 0 (2), является частичной функцией 
Д:Лх Л— >ЛхЛ. Областью определения данной функ- 
ции является декартово произведение атрибутов и 
состояний, допустимых для конечного автомата 0, 
а множеством значений - преобразованные конеч- 
ным автоматом пары <элемент_алфавшпа, состоя- 
ние>. При необходимости подчеркнуть связь А с 
автоматом 0 используется запись А е . 

Считается, что функция перехода, как правило, 
дискретна, т. е. может быть задана множеством пар: 

А ^{(а,<5),(а',<5')}. (3) 


На рис. 1 данным парам (3) соответствуют х - 
текущий анализируемый атрибут, у - атрибут, ко- 
торый автомат записал в выходной поток после об- 
работки, и переход между состояниями <5 — ><5'. 


Входная лента 


Выходная лента 



Рис. 1 . Структурная схема конечного автомата 


Входом и выходом любого автомата являются 
регулярные списки, которые могут быть вложенны- 


ми. Двухуровневые списки, при соблюдении неко- 
торых условий, сопоставляются плоским таблицам 
реляционного подхода - ниже рассматриваются 
именно такие списки. Списки большей вложенно- 
сти также не запрещены, так, трехуровневые струк- 
туры могут использоваться при моделировании 
темпоральных или интенсиональных баз данных. 

Введем понятие атрибута, которое понадобится 
для более строгого определения входного и выход- 
ного потоков автомата и других необходимых 
структур. Будем различать имя атрибута и его значе- 
ние (интерпретацию), а также первичные (прими- 
тивные) и непервичные атрибуты. Прежде всего, 
определим рекурсивно понятие допустимого имени. 

Пусть аеА, а - допустимое имя, тогда а и а.а - 
также допустимые имена, во втором случае ап а 
называются префиксом и суффиксом, соответ- 
ственно. Допустимое имя а становится именем ат- 
рибута, только если оно связывается с некоторым 
доменом 7еТ. Факт связывания отмечается запи- 
сью Т( а) или а. Т (точечная пара, согласно нотации 
языка ЛИСП) - первая форма подчеркивает функ- 
циональность связывания, а вторая - его ссылоч- 
ность. Если Те О, и а — примитивный атрибут, то 
а. Т заменяется на сДлибо на а, когда ссылка на до- 
мен не существенна или очевидна из контекста. 
Связь именованного объекта с интерпретацией I 
изображается стандартной записью (имя)\ ѵ Интер- 
претация задается традиционно: примитивному ат- 
рибуту сопоставляется константа из первичного 
домена а\е 7| ь тогда автоматной функции А° соот- 
ветствует отображение А^ДхД— ►Дхіф. 

Любой непервичный домен Т, где 7еТ\Д явля- 
ется структурой над именованными компонентами: 

а.Т ^±а.(а ѵ Т 1 ,...,а п .Т п ), (4) 

где а — параметр-модификатор имен элементов 
списка согласно точечной нотации, а, я,е А - попар- 
но-различные, 7еТ\Д ТеА. В определении домена 
допускается рекурсия (в том числе, и неявная). 

Интерпретация а.Т\\ определяет пустой или 
сколь угодно длинный (но конечный) регулярный 
список вида а.((а І .ф| 1 ,...,а,,.?„ 1 | І )...(й 1 ./ № | І ,...,а„.Ц)), где 
для всех значений индексов і=\,...,п,]=\,...,к, а,ек, 
/у : е Т\ ь Т,е Т. Регулярность списка определяется 
тем, что различные и і іт принадлежат одному и то- 
му же домену 7) (4). Префикс может быть продол- 
жен в скобочные фрагменты на любую глубину, так 
что оД(я 1 .ф...)...)= а Да.(я 1 .ф...)...)= л Д(о:.я 1 .? 11 ...)...). 
Такие структуры можно считать таблицами, подра- 
зумевая, что подсписки соответствуют строкам 
(кортежам) таблиц реляционного подхода. Ясно, 
что (, в свою очередь, могут являться списками, 
возможно, пустыми. 

Рассмотрим реализационные аспекты, исполь- 
зующие функциональный аппарат системы програм- 
мирования ЛИСП [5]. Зададим описание автомата 
А-термом в стиле функциональных языков вида: 

0 = (Ах.А[*]). (5) 
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Как было выше указано (2), 0еТ\Д где 0 - 
имя автомата не может быть именем из первичного 
домена, а [а], определяемое формулой (3), тради- 
ционно обозначает вхождение (элементов) списка 
в форму А. 

В наиболее общем случае структура формы А 
определяется следующей конструкцией согласно 
нотации языка ЛИСП: 

( 00 ( <іпіі _/от>) ( <Мор_сот1Моп> <ас1іот>) <ас1іот>). (6) 

Интерпретацией автомата 0 (5), как отмечалось 
выше, является применение его к списку 8 интер- 
претированных атрибутов - это обозначается тра- 
диционной для функционального подхода записью 
(051]) или (08), если интерпретация очевидна из 
контекста). Результатом интерпретации автомата 
является также список (возможно, пустой), кото- 
рый, в свою очередь, может использоваться в каче- 
стве домена при спецификации нового атрибута. 
Поскольку атрибуты А могут являться примене- 
ниями автоматов, возникает вопрос о трактовке 
операции суперпозиции автоматов, который реша- 
ется через вложенный функциональный вызов. 

Рассмотрим ряд дополнительных соглашений 
относительно рекурсивных структур данных. Пусть 
регулярный список I некоторым образом порож- 
дается доменом 7’ 0 =(а 1 .7' 1 ,...,й„.7’„), состоящим из 
первичных атрибутов. Условимся рассматривать 
только такие списки, у которых первый атрибут 
связан с первичным доменом, то есть Т,еО (син- 
таксическое ограничение). Соответственно, первый 
атрибут (а,. 7 1 ,) будем называть первичным ключом и 
считать его уникальным именем любого подсписка 
списка Ь верхнего уровня, так что в 
С=а.((а 1 Л 11 | І ,...,й„.Ц)...(а 1 .Ц,...,а„.Ц)) значения 
всех й|./|,]| - попарно-различны, т. е. уникальны (се- 
мантическое ограничение). 

Множество К І ^±{а 1 і и |,} (7) 

будем называть ключевым множеством списка I. 
Считается, что на элементах Д определено отноше- 
ние полного порядка ("<&"), как правило, индуци- 
руемое соответствующим отношением на Т ь а так- 
же операция инкрементирования. Важно подчер- 
кнуть, что в набор параметров автомата х (5) опре- 
деления автомата в качестве обязательного параме- 
тра входит системный ключ й,. Отметим, что отно- 
шения порядка могут быть определены на домене 
любого атрибута (группы атрибутов), - это позво- 
ляет организовывать необходимые индексирован- 
ные цепочки, что аналогично понятию ключа в ре- 
ляционном подходе. 

Подчеркнем еще раз, что любой домен является 
порождением автомата, при этом первичные доме- 
ны трактуются, как реализации ів-а отношений 
(автоматов) вида (ів-а Ше§егх), доставляющих ис- 
тину, если предъявленный объект распознается 
корректно. 

Переопределим понятие таблицы данных в пред- 
ложенных соглашениях. Для этого зададим понятие 


схемы таблицы для объекта данных г - это поимено- 
ванный список тэгов вида: 7 іг)=л(...,7’(й,),...). При 
рассмотрении набора таблиц допускается появление 
неявной или опосредованной рекурсии, причем тре- 
бование присутствия в описании каждой схемы хотя 
бы одного первичного атрибута гарантирует конеч- 
ность реализации любой таблицы. Для «свертки дан- 
ных» используется автомат-конструктор: 
(СОШТК(Т(а ] ,...,а П )))= ІСІ (Т(а 1 ,...,а„)). Во внешней пе- 
ременной запоминается прохождение всех рекур- 
сивных ответвлений при обработке данных, что со- 
кращает время обработки. 

При реализации существенным образом ис- 
пользуется теория функциональных моделей, в 
частности, из нее заимствованы обозначения [6]. 
Определим обратную операцию - развертку дан- 
ных на непервичном атрибуте. Пусть 
Т(г)=г.(..., Д(йД,...) - описание домена (4) и домен 
Т^В. Развёрткой домена Т на атрибуте а будем 
называть список, получающийся в результате под- 
становки в описание исходного домена на место 
имени 7 ДйД, раскрытого соответствующим авто- 
матом, подсписка-домена 7 )(йД. Все добавленные 
в развернутый домен Т в результате такого дей- 
ствия атрибуты модифицируются префиксом г.а і; , 
что индуцирует и модификацию автомата, доста- 
вляющего реализацию домена Д(йД. Процесс по- 
строения развёртки на атрибуте может повторяться 
многократно - пока имеются атрибуты, связанные 
с неэлементарными схемами. 

Зададим операцию полной развертки. Под пол- 
ной развёрткой домена Т понимается завершенный 
процесс применения соответствующего автомата к 
интерпретации домена. Полная развёртка реализу- 
ет систему строго вложенных стеков, которая для 
рекурсивных доменов, вообще говоря, может ока- 
заться неограниченной. Для сохранения конструк- 
тивности построений как раз и вводятся понятия 
первичного ключа (7) и введенное понятие замыка- 
ния атрибутов относительно автоматного домена 
(запроса). 

Пусть Т - автоматный (возможно, рекурсив- 
ный) домен и пусть А - некоторый набор атрибутов 
домена. Замыканием А* для А относительно Т бу- 
дем называть объединение всех таких атрибутов X, 
что автоматное отображение 0:Д— может быть 
получено из информации о домене Т. Здесь 0 - 
(автоматный) терм в сигнатуре Е, построенный по 
специальным правилам, А и X - непустые наборы 
атрибутов. Замыкание А* используется для обеспе- 
чения семантической необходимости выхода из ре- 
курсии в практических случаях. 

В предлагаемом подходе (6) результат обработ- 
ки произвольного списка вычисляется «по ча- 
стям», т. е. вместо вычисления полного списка 
а.(а ѵ 1\,а г Л ъ ...,а п .1А можно найти первый элемент 
а.(а ѵ 1 { ) и выполнить вычисления остальных эл- 
ементов с помощью автоматов, реализующих кон- 
кретные операции. При этом получается принци- 
пиальная экономия памяти ценой незначительно- 
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го перерасхода времени на вспомогательное по- 
строение. Автоматная операция - это просто ссы- 
лка на уже существующую (ранее определенную) 
программу, связанную с контекстом ее исполнения 
(вставка, удаление или выборка), т. е. с состоянием 
ассоциативного списка в момент его построения. 

Для повышения эффективности работы авто- 
матов, введем специальные операции || - приоста- 
новка вычислений и @ — возобновление ранее отло- 
женных вычислений. Техника приостановки и во- 
зобновления функций может быть названа вызовом 
по необходимости. 

Например, для построения ряда целых от М до 
И с последующим их суммированием, выполним 
следующее: 

(Ие/ип ряд_цел (МИ) (сопИ ((> МИ) піі) 

(Т(сот М( || (ряд_цел (1+ М) И)))))) 

(Ие/ип вит (X) (сот) ((= X 0) 0) 

(Т(+ (саг Х)( @ (вит (сйгХ))))) )), 
где саг - первый элемент из активного значения 
списка, сИг - активное значение списка без перво- 
го элемента, сот - формирование узла по двум 
верхним значениям списков, сот) - условие завер- 
шения вычислений, піі - терминальный элемент 
списка, шт - автомат, выполняющий операцию 
суммирования чисел. 

С целью исключения повторного вычисления 
совпадающих списков, в его внутреннее предста- 
вление вводится логическая переменная (йа§), 
имеющая значение Тше (истина), для уже выпол- 
ненных шагов прохождения рекурсии, и Раіке 
(ложь) - для невыполненных. 

Данный автомат-операция позволяет обрабаты- 
вать неограниченные рекурсивно-вычислимые 
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множества. Например, можно работать с рядом це- 
лых чисел, больших чем И: 

(Ие/ип цел (М) (сот М ( || (цел (1+ М) )))). 

Из организованного таким образом списка, 
можно выбирать нужное количество элементов; 
например первые К элементов можно получить 
применением функции: 

(Ие/ип первые (К Іпі) 

(сопсі ((= Іпі ИИ) Ш)((= К 0) ИП) 

(Т (сот (саг Іпі)( первые ( @ 

(сИг Іпі))) )) )). 

Эффект таких приостанавливаемых и возобно- 
вляемых вычислений получается путем следующей 
реализации операций || и @: 

||е = > (ІатЬИа () е ), 

@е = > (е ), 

что при интерпретации приводит к связыванию 
функционального аргумента с ассоциативным спи- 
ском для операции || и к вызову функции выполне- 
ния ЕѴАЬ для операции @. 

Таким образом, предложенная методология мо- 
жет использоваться в качестве теоретического ап- 
парата для построения систем управления базами 
данных, поддерживающих естественное предста- 
вление и механизмы манипулирования рекурсив- 
ными структурами, а применение автоматного 
подхода позволяет повысить эффективность обра- 
ботки таких данных, поскольку ни одна суще- 
ствующая система менеджмента данных не имеет 
внутреннего аппарата для работы с рекурсивными 
структурами. 
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